VLM (Vision Language Model, 시각 언어 모델) VLM (Vision-Language Models, 시각-언어 모델) 모델 Qwen2.5-VL 멀티모달 비전 언어 모델 LLaVA-NeXT (Large Language and Vision Assistant - Next) Q-Former (Querying Transformer) 시각-언어 정렬을 위한 정보 병목 아키텍처 및 파생 모델